문자의 표현 방식(인코딩)

90년대의 한글 코드를 보면 "완성형(KSC5601)과 조합형"으로 구분된다.
최근에는 조합형 코드는 사용하지 않고 완성형을 사용한다.

코드의 종류

EUC-KR

EUC-KR 은 완성형 코드의 발전 형태이다. "특수 문자 + US-ASCII + KSC5601 = EUC-KR "
영문/숫자/기호는 1바이트 한글과 한자는 2바이트로 표현된다.
euc-kr (ksc c 5601-1987) 로 불리는 인코딩이며 웹페이지 작성에 사용할 수 있다.
특수한 외국어 문자나 일본식 / 중국식 한자는 표현할 수 없습니다.


UTF-8 (월페이지용 유니코드)

이것은 인터넷이나. 리눅스/유닉스 등에서 사용하는 8비트 유니코드이다.
웹페이지 관련 작업에서 “유니코드라고 할 때에는 이 UTF-8 유니코드를 가리킵니다.
웹페이지를 유니코드 인코딩으로 만들 때에는 반드시 "UTF-8 유니코드“를 사용해야 한다.
영문이나 숫자 등은 1 바이트로 표현하고 한글이나 한자 등은 3바이트로 표현한다.


문자가 깨지는 이유

영어가 아닌 문자가 깨지는 이유는 웹페이지가 저장된 문자의 표현 방식과 웹브라우저가 웹페이지를 해석하는 방식이 일치하지 않을 때 발생한다.

해결하기 위한 방법으로 태그를 이용하여 인코딩 방식을 지정하여 웹브라우저가 해석할 수 있게 하여야 한다.

< meta charset="utf-8" >

인코딩 설정

개발 소프트웨어에서 설정

웹페이지에서 많이 쓰는 문자의 표현 방식은 "UTF-8(조합형 유니코드 인코딩 방식) "이다.
대부분의 통합 개발 환경 소프트웨어는 인코딩 방식을 선택할 수 있게 되어있다.
예) VisualStudioCode


통합 개발 환경 (Integrated Development Environment, IDE)

소프트웨어 개발에 관련된 모든 작업, 즉 패키지 인클루딩, 문서 편집, 컴파일, 디버그, 원격 서버 액세스 등을 하나의 프로그램 안에서 모두 처리하는 환경을 제공하는 툴.


파일 인코딩 일괄 변경 프로그램

changefileencode-goofygod는 국네에서 개발된 툴로 간단하면서 사용하기가 쉽습니다.
UTF-8로 작성된 프로그램 소스 파일을 EUC-KR 로 변환뿐만 아니라 매우 다양한 포맷을 지원한다.

프로그램 개발자 사이트:
http://blog.naver.com/goofygod/110024510522
changefileencode-goofygod.exe

메모장에서 기본 문자 인코딩을 변경

1. Windows 키 + R을 누르고 regedit를 입력 한 다음 확인을 선택하거나 .exe 누릅니다.

2. 이제이 특정 레지스트리 분기를 찾으십시오.
HKEY_CURRENT_USER\소프트웨어\마이크로소프트\메모장

3. 편집 메뉴에서 새로 만들기>DWORD(32비트) 값을 클릭한다.

4. 값의 이름은 다음과 같아야한다. : iDefaultEncoding

5. iDefaultEncoding을 두 번 클릭한 다음 데이터를 1(ANSI의 경우)로 설정한다.

다음은 할당 할 수있는 가능한 값 데이터 목록이다.
1 = ANSI
2 = UTF-16 LE
3 = UTF-16 BE
4 = UTF-8 BOM
5 = UTF-8

6. 이제 레지스트리 편집기를 종료한다.

7. 그런 다음 메모장을 열면 상태 표시 줄에서 기본 인코딩이 ANSI로 변경되어 있다.
참고: 위의 레지스트리 변경 내용은 Notepad.exe를 실행하여 새 메모장 인스턴스를 시작할 때만 적용된다.이전에 저장된 텍스트 문서가 다른 인코딩으로 저장된 경우에도 마찬가지이다.
파일을 저장하면 지정한 인코딩 형식과 동일한 인코딩 형식으로 열립니다.